Ultra Ethernet(UEC,超以太网)
挑战 InfiniBand 垄断的开放标准联盟 — 由 AMD / Arista Networks / Broadcom / Cisco / Intel / Meta / 微软 等八家在 2023 年共同发起,旨在用"改进版以太网"取代 NVIDIA 主导的 InfiniBand 作为 AI 训练集群的网络底座。UEC 1.0 规范于 2024-2025 推进,产品化在 2026-2027。
定位与背景
NVIDIA 2019 年收购 Mellanox 后,InfiniBand 协议事实上被一家公司控制。在万卡 GPU 集群(GB200 NVL72 / GB300 NVL72)成为主流的 AI 训练时代,超大规模云厂商(Meta / 微软 / AWS)和芯片巨头不愿被单一供应商绑架,于是合纵 Linux Foundation 旗下成立 Ultra Ethernet Consortium,目标是把以太网"AI 化"——保留生态开放性,弥补传统以太网在丢包、延迟、负载均衡上的短板。
核心技术特性
| 技术点 | UEC 设计 | 对标 InfiniBand |
|---|---|---|
| 拥塞控制 | 包级喷洒(packet spraying)+ 多路径 ECN | 信用流控 |
| RDMA | 增强 RoCE v3 | IB Verbs |
| 尾延迟 | 端到端 <10μs | <2μs |
| MTU | 优化大包传输 | 4KB/8KB |
| 错误恢复 | 快速重传 + 选择性重传 | Link-level |
| Endpoint 数 | 单 fabric 100 万+ | 4 万 |
| 软件栈 | 开源(SONiC 友好) | 闭源 |
UEC 把网络栈拆为 Physical / Link / Transport / Software 四层规范,允许不同厂商在各层独立创新,避免 InfiniBand "硬件协议 + 软件栈"端到端绑定。
关键玩家与生态
- 芯片层:Broadcom(Tomahawk 5/6)、Marvell、Intel IPU、AMD(Pensando DPU)
- 设备层:Arista Networks 7800R4 / 7060X、Cisco Nexus 9000、白牌交换机
- 客户层:Meta AI 集群、微软 Azure、Oracle OCI、AWS
- 软件层:SONiC 开源 NOS、EOS
在 AI 产业链中的角色
UEC 是 AI 网络的"反垄断方案"——通过把训练流量从专有 IB 迁回开放以太网,让超大规模客户拿回议价权和供应链灵活性。一旦 UEC 1.0 在 2026-2027 大规模产品化,NVIDIA Spectrum-X 以太网平台和 InfiniBand Quantum 平台都将面临阵营式挑战。中国厂商(华为 / 新华三 / 锐捷网络)可以通过加入 UEC 工作组,弯道超车进入全球 AI 网络标准制定。
演进时间线
- 2023-07-19 UEC 正式宣布成立,9 家创始成员(AMD / Arista / Broadcom / Cisco / Eviden(Atos) / HPE / Intel / Meta / Microsoft)(Linux Foundation 官方公告,T1);至 2023-11 后 4 个月会员增长 450%(+45 家)
- 2024-Q1 工作组发布 UEC 1.0 草案
- 2025 首批兼容芯片(Tomahawk 5)+ 交换机出货
- 2026E UEC 1.0 正式发布,1.6T 端口支持
- 2027E 大规模训练集群部署(Meta / 微软标杆案例)
风险与不确定性
- 标准成熟时点滞后于 NVIDIA Spectrum-X 商用节奏
- InfiniBand 在延迟敏感场景仍有 2-3 年技术领先
- 联盟内部商业利益分歧(Broadcom vs Marvell vs Cisco)
- 中国厂商加入受地缘政治影响
∈ belongs_to::2-12-网络设备